Marek Rosa - Goodai博客领域信息情报检索

GoodAI正在构建一种通用人工智能,这是一个可以像人类一样学习、具有创造力和适应环境能力的软件程序。他们的人工智能将根据自己的感知做出反应,并与环境互动以实现人类导师定义的目标。

介绍 Charlie Mnemonic:第一个具有长期记忆的个人助理

Introducing Charlie Mnemonic: The First Personal Assistant with Long-Term Memory

作为持续学习研究工作的一部分,我们正在开源 Charlie Mnemonic,这是首款配备长期记忆 (LTM) 的个人助理(LLM 代理)。乍一看,Charlie 可能类似于现有的 LLM 代理,如 ChatGPT、Claude 和 Gemini。然而,它的特色是 LTM 的实现,使其能够从每次交互中学习。这包括将用户消息、助手响应和环境反馈存储并集成到 LTM 中,以便在与手头任务相关时将来检索。Charlie Mnemonic 结合使用长期记忆 (LTM)、短期记忆 (STM) 和情景记忆来提供情境感知响应。这种随着时间的推移记住交互的能力显著提高了对话的连贯性和个性化。此外,Charli

教授 LLM 代理控制无人机

LLM Agent taught to control drones

在上面的视频中,我们演示了我们的一个 LLM 代理学习如何使用 API 来控制无人机四轴飞行器的学习过程。初始阶段需要我们向代理提供详细而全面的说明,说明如何发送 HTTP 请求以及通过 API 可以使用哪些命令。随着视频的进展,代理很快掌握了这些说明,并利用它已有的知识来执行高级而复杂的任务,例如让无人机沿着方形轨迹飞行。这展示了代理的弹性和自适应学习能力 - 代理如何从错误和错误假设中恢复。此版本的持续学习代理代表了我们的第一个原型(体现在 Python 终端中的代理)的重大进步。这个增强的代理可以访问不同形式的工作记忆和长期记忆,使其能够有效地管理几种类型的记忆不一致,例如矛盾或过时的信

实践中的集体智慧:安全是一项人权

Collective intelligence in practice: Safety as a human right

在 GoodAI 内部的一个小而敏捷的团队中,我们着手解决无人机操作中的挑战,并开发用于异构智能代理组与人类协作的工具。这项工作建立在 GoodAI 在多智能体系统方面的研究历史之上。以下是介绍我们愿景的“故事板”,我们正忙于将其变为现实:在 GoodAI,我们一直在寻找 AI 可以带来最大好处并真正增强人类能力的用例。我们发现,如果无人机能够更实惠、更强大(换句话说,如果可以使用一组更小、可一次性使用的智能单元而不是几架昂贵的无人机),并且更易于使用(这样人们就可以在无需特殊培训的情况下运行复杂的无人机操作),那么无人机可能会成为安全和安保领域的游戏规则改变者。简化无人机操作我们的第一个目标

未来冲击与有效加速主义

Future Shock versus Effective Accelerationism

本文是我在 2023 年 5 月为 Level 杂志撰写的客座文章。阿米什人社区位于美国的中心地带,他们的生活方式似乎从容不迫,远离现代社会的忙碌节奏。虽然人们普遍误以为他们完全拒绝科技和电力,但事实却更加微妙。是的,他们确实会使用电力来使用某些电器,这是大多数家庭的常见必需品,但他们坚决拒绝接入公共电网。这一有意识的决定象征着他们致力于与非阿米什人世界及其可能带来的文化影响保持一定距离。他们并没有积极寻找新技术来融入他们的生活,而是在面对不断变化的世界时寻找维持自己选择的生活方式的方法。然而,与这种从容不迫的节奏形成鲜明对比的是,许多人都在努力应对快速的变化。阿尔文·托夫勒 (Alvin T

具身集体:我们迄今为止的进展

Embodied collectives: our progress to date

在 GoodAI,我们正在构建协作式 AI 代理,以增强人类能力并大规模推动积极变革。集体智慧是我们工作的指导原则。我们的一个团队致力于开发 AI 代理,例如基于大型语言模型的 AI 助手、程序员、研究人员和斯多葛导师。同时,另一个团队正在开发 GoodAI Groundstation 平台,允许代理在物理世界中运行。民主化安全GoodAI Groundstation 使个人能够同时控制多个机器人,而无需经过专门培训。用户提供高级目标,机器人自主执行任务。团队成员参与社区安全为我们提供了第一个犯罪预防的实际用例,并激励我们创建一种使安全民主化的工具。虽然在许多情况下仍然是一种奢侈,但我们相信安

介绍 GoodAI LTM Benchmark

Introducing GoodAI LTM Benchmark

作为我们在持续学习领域研究工作的一部分,我们正在开源一个基准,用于测试代理在非常长的对话中执行涉及高级使用记忆的任务的能力。除其他外,我们评估代理在需要动态维护记忆或长期整合信息的任务上的表现。我们正在开源:现行的 GoodAI LTM 基准。我们的 LTM 代理。我们的实验数据和结果。我们表明,信息的可用性是解决这些任务的必要条件,但不是充分条件。在我们的初始基准中,具有 8k 上下文的对话 LTM 代理与具有 128k 个令牌的长上下文 GPT-4-1106 相当。在内存要求高出 10 倍的更大基准测试中,我们的具有 8k 上下文的对话式 LTM 代理的性能比上下文大小为 128,000

LTM Benchmark:改进和新报告

LTM Benchmark: Improvements and new reports

在 GoodAI,我们致力于开发能够持续和终身学习的代理。作为我们努力的一部分,我们之前已经开源了 GoodAI LTM 基准,这是一套旨在评估任何对话代理的长期记忆 (LTM) 能力的测试。在这个基准中,所有任务都作为代理和我们的虚拟测试人员之间一次非常长的对话的一部分进行。基准交织了来自不同任务的信息和探索性问题,尽管特别注意将它们编织成自然对话。LTM = 长期记忆作为我们对具有 LTM 的代理进行研究的直接结果,GoodAI LTM 基准在不断发展。对我们来说,它是评估我们的代理和验证我们的假设的宝贵工具。此外,它帮助我们描述不同代理失败的方式,因此它为我们提供了目标。在 GoodAI

为什么我们没有看到任何主流游戏使用 LLM 驱动的 AI NPC?

Why haven't we seen any mainstream games utilizing LLM-driven AI NPCs?

因为这很难……我们在过去四年中一直致力于这项工作。制作一个简单的概念验证 (PoC) 很容易(我们已经见过很多),但要将其完善到生产级别,需要付出 1,000 倍的努力,因为会出现更深层次的复杂性:1) 成本:通过 API 使用 LLM 意味着有人必须为每个玩家每小时支付数千个代币。是的,你可以在玩家的 GPU 上运行较小的 LLM(例如 Mistral、Llama3 8b),但质量和功能可能不足以提供引人入胜的叙事和游戏玩法。2) 现在还为时过早:GPT-3.5 才 1.5 年,GPT-4 才 1 年。3) 当前的 LLM:它们可能无法在长时间的游戏会话中运行多智能体叙事。上下文大小不足以一

什么造就了弹性文明?

What Makes A Resilient Civilization?

这篇博文以《韧性文明协会 (res/civ) 宣言》中提出的想法为基础。该协会以技术乐观主义为根基,旨在解决建立长期社会韧性的复杂性,并探索人工智能时代的有效策略和工具。在这篇文章中,我们概述了众多可能的方法之一来解答这个问题:什么造就了韧性文明?扮演一个假设的设计师/程序员的角色,我们可以想到几个设计元素和原则:1. res/civ 作为“程序化文明”:将文明视为支持增长和实验的系统框架。引入具有连续反馈循环的“稳定”和“实验分支”,以安全地测试新模型和政策。2. 韧性文明的关键支柱:乐观:培养乐观和积极思考的文化至关重要。一个有韧性的社会会避免恐惧和悲观,保持前瞻性的视角。增长:可持续增长

国家人工智能:为您服务的政府

State AI: A Government That Works for You

国家人工智能:为您服务的政府想象一个治理不是由政客推动而是由先进的人工智能系统推动的世界。这一概念,我们称之为“国家人工智能”,代表了对未来社会管理方式的彻底重新构想。核心概念国家人工智能的本质是:用复杂的人工智能系统取代传统的政府结构(政客、官僚机构、机构)。公民仅根据自己的价值观、偏好和期望结果进行投票。国家人工智能随后将致力于:实施政策利用国家的自然资源创造免费产品和服务以最佳方式实现公民定义的这些目标这种创新方法可以带来:更一致、更高效的治理消除政策制定中的腐败和私利数据驱动的客观决策,而不是政治操纵虽然这一概念乍一看似乎存在争议甚至令人不安,但它的逐步引入可能会彻底改变我们的治理和社

对 AI NPC 的道德义务和模拟假设

Moral Obligations to AI NPCs and Simulation Hypothesis

Olaf Witkowski 的文章“我们对人工生命负有道德义务吗?”让我开始思考游戏中人工智能的道德含义以及我们现实的本质:1) 游戏中的人工智能:如果我们开发了有意识或有知觉的人工智能 NPC,我们是否应该避免在游戏中使用它们以防止不道德的对待?我们不应该将生物用于娱乐。相反,我们应该致力于制作看起来有意识或有知觉的人工智能 NPC——类似于看似真实但完全虚构的电影角色。这种方法尊重道德界限,同时保留了我们游戏的叙事深度和娱乐价值。2) 模拟假设:关于我们是否生活在模拟中的讨论往往忽略了实际考虑。例如,想象一下欧盟的游戏开发商开发一款生活模拟游戏;他们将受到欧盟法律的约束,禁止模拟某些非法

弹性文明协会 - 宣言

Society for Resilient Civilization - a Manifesto

摘要:人工智能的角色和人类的未来:人工智能的进步引发了人们对人类角色以及以价值观为指导的弹性社会的需求的思考。弹性文明社会:提出“弹性文明社会”,旨在确保人工智能造福所有人,不被垄断,并帮助人类进化。弹性特征:弹性社会的适应性、多样性和平衡性可以在个人和组织层面得到支持。组织和个人策略:组织成员促进权力平衡和多样化,而个人发展正直和长期决策技能。流动成员和后续步骤:不断发展的贡献者将催化社会变革和个人成长,举办研讨会,并开放讨论和探索的想法。作为一个文明,我们将走向何方?人工智能在每一项任务上都逐渐比人类做得更好,所有工作被人工智能取代只是时间问题。作为人类,我们面临着诸多问题:我们的角色和目

2033 年的游戏

Games in 2033

这是我在 2023 年 5 月为 Level 杂志撰写的文章的修订版。引言在人工智能和神经接口技术的进步的推动下,未来十年将见证游戏行业的革命性变革。本文介绍了游戏的五个阶段的演变,每个阶段都建立在之前的创新和技术突破的基础上,极大地重塑了游戏体验及其社会影响。从智能 NPC 到沉浸式神经接口,我们将探索每个阶段如何促进这一根本性转变。内容:智能 NPC AI 生成的游戏和资产 AI 模拟游戏(中频模拟)AI 模拟游戏(高频模拟)神经接口 AI 模拟游戏中的观察者效应对社会的影响第 1 阶段:智能 NPC第一阶段将引入 AI 生成的智能 NPC(非玩家角色),它们能够观察、理解、思考、计划、做

GoodAI LTM Benchmark v3 发布

GoodAI LTM Benchmark v3 Released

GoodAI LTM 基准测试的主要目的一直是作为我们在开发能够持续和终身学习的代理方面取得进展的客观衡量标准。但是,我们也希望它对开发此类代理的任何人都有用。为了实现这一点,我们已将此版本定位为更易于理解并产生更标准化的结果,我们希望这些结果更容易进行比较和分析。从基准测试的第一个版本开始,我们就将特定的测试实例分组到数据集或任务类型中。例如,有一个名为“购物清单”的数据集,我们可以从中抽取任意数量的不同测试实例,以评估代理记住一系列物品并保留用户购物清单的更新版本的能力。在早期版本中,每个测试可能会产生任意数量的分数点,并且这些分数点未标准化。这可能导致令人困惑的情况,即通过高度复杂的测试

HALLM:通过 Python 终端观察和行动的代理

HALLM: An Agent that Observes and Acts through a Python Terminal

在 GoodAI,我们致力于安全 AGI 的进步。大型语言模型 (LLM) 无疑提供了强大的功能,但它们本身也存在局限性 — 尤其是无法在部署后学习新技能。我们的创新方法正是在这里大放异彩。我们设计的代理不仅可以利用 LLM 的基础功能,还可以对其进行显著扩展。通过我们独特的架构和新颖的方法,我们的代理赋予 LLM 持续学习的能力,使它们能够理解复杂的指令、随着时间的推移进行适应,并在复杂的推理和解决问题的任务中表现出色。HALLM 可以联系用户以询问更多信息,或者如果它认为用户可以帮助它做某事,例如安装 Python 包或重新启动系统。在上面的视频中,HALLM 使用内置函数“input”要

太空工程师:信号

Space Engineers: Signal

摘要:基础游戏中的新方块:广播控制器、动作中继器、紧凑型天线等!新的红船起始场景、新的世界屏幕,可改善新玩家体验,改善生活质量新优质内容:桁架组、走廊方块、嵌入式墙壁等!下一步你好,工程师们!新的信号更新来了!“信号”为太空工程师的新时代奠定了基础。2024 年将是探索、战斗和生存的一年。此更新侧重于我们为玩家与环境的新标准框架。信号通过专为此场合创建的新方块为您的创意库添加了新选择。使用这组新方块,您的远程自动化可以以全新的自主性运行。广受欢迎的“自动机”更新添加了远程采矿作业、自动无人机、焊接助手等等,“信号”使这些系统能够进行通信!现在可以进行反应式更新、直接聊天以及通过多艘船、站点或任

太空工程师在 PlayStation 上发布!

Space Engineers released on PlayStation!

摘要:您需要了解的有关跨平台游戏专用服务器的所有信息MOD 支持PCU 限制立即购买问候,工程师们!我们很高兴欢迎 PlayStation 社区加入我们并满足“创造需求”。全球已售出 500 万份,并在 PC 和 Xbox 上拥有忠实的追随者,我们很高兴将太空工程师的体验带给 PlayStation 玩家,让更多有抱负的工程师释放他们的创造力并探索新的可能性世界。通过全面的跨平台游戏支持,PlayStation、Xbox 和 PC 玩家可以无缝组队并一起踏上惊心动魄的冒险之旅,无论他们选择哪个平台。经过令人难以置信的 Beta 之旅,我们很高兴地宣布太空工程师已准备好在 PlayStation

太空工程师:10 周年更新

Space Engineers: 10 Year Anniversary Update

摘要:庆祝太空工程师 10 周年基础游戏中的新方块:工程师雕像、烟花、燕尾服皮肤等等!新优质内容:10 周年纪念包太空工程师 2023 年的声音 Steam 免费周末新的 10 周年纪念商品你好,工程师们!玩得开心时时间过得真快。十年前,我们开始了这段不可思议的星际之旅,为现在发生的一切奠定了基础。10 年、500 万份拷贝、数百次更新、以及 50 万个工作室模组和创作之后,太空工程师仍然在蓬勃发展!致浩瀚太空中的每一位太空工程师,那些从一开始就和我们在一起的人,到现在才成为太空工程师的人,感谢你们成为这段旅程的一部分。您对太空工程师的创造力和热情激励着我们做到最好。为了庆祝这一不可思议的时刻